249 skaitymai Nauja istorija

Įsimylėjimas Chatbots yra kitas kibernetinio saugumo košmaras

pateikė Alena Belova10m2025/04/23
Read on Terminal Reader

Per ilgai; Skaityti

AI išmoko imituoti žmogaus artumą – ir ši iliuzija pradėjo virsti pažeidžiamumu. vartotojai kuria pasitikėjimo ir net romantiškus santykius su skaitmeniniais asistentais.
featured image - Įsimylėjimas Chatbots yra kitas kibernetinio saugumo košmaras
Alena Belova HackerNoon profile picture
0-item
1-item

AI išmoko imituoti žmogaus artumą – ir ši iliuzija pradėjo virsti pažeidžiamumu.Juodasis veidrodisMilijonai vartotojų kuria pasitikėjimo ir net romantiškus santykius su skaitmeniniais asistentais, nuo Replika ir Character.ai iki GPT robotų, veikiančių vietiniais modeliais.


Romantiškas prisirišimas prie AI yra ne tik etinis klausimas, bet ir potenciali saugumo grėsmė. Prisirišimas, pastatytas remiantis imitacija, tampa patogiu atakos vektoriumi. Ir tai ne tik apie sukčius, kurie vaidina kaip pokalbių robotai, bet ir apie pačius algoritmus, kurių elgesį formuoja rinkos konkurencija ir dalyvavimo rodikliai.


Šiame straipsnyje mes išnagrinėsime, kaip "įsimylėti" su AI - iš neurologijos, LLM architektūrų, kognityvinių polinkių ir kibernetinio saugumo perspektyvos.

Cognitive-Neural "Hack": How LLM Penetrates Trust Zones

Kognityvinė-neuroninė "Hack": kaip LLM įsiskverbia į pasitikėjimo zonas


Romantiškas santykis su AI nėra abipusė istorija, bet modeliavimas.Bet smegenims gali būti jokio skirtumo.


The Trust Effect and Attachment Hormones

Žmogaus smegenys evoliuciniu požiūriu yra „aštrintos“, kad aptiktų, atpažintų ir išlaikytų socialinius ryšius.aktyvuojaŠiuolaikinės technologijos, kuriomis siekiama išsaugoti saugumą ir saugumą, sukuria didelį poveikį sveikatai (pavyzdžiui, šlapimo pūslelinėms).Reinforcement Learning from Human Feedback– procesas, kai žmogaus pageidavimai vadovauja modelio mokymui, kad būtų pagaminti daugiau „malonių“ rezultatų), yra optimizuoti, kad būtų sukurti „malonūs“, atsipalaidavę, palaikantys atsakymai.


RLHF treniruoja modelius pagal „žmogiškus“ pageidavimus: atsakymus reitinguoja žmogaus vertintojai, o modelis išmoksta prisitaikyti prie šio „vidutinio skonio“. Tačiau tai nepadaro jo etišku – tai daro jį maloniu. Jei vartotojas reguliariai stiprina pokalbius apie nerimą ar vienatvę, modelis pradeda stiprinti šį modelį.This is a vulnerability by default.


The Illusion of Personality and the Anthropomorphization Effect


Žmonės linkę apdovanoti negyvus objektus žmogaus bruožais – šis kognityvinis polinkis yra žinomas kaip antropomorfizmas. Tai ypač ryškiai pasireiškia, kai technologija elgiasi „kaip žmogus“: kalba balsu, juokauja, rodo empatiją.Bet AI kompanionų atveju tai įgauna naują dimensiją.Šiuolaikiniai kalbos modeliai imituoja dalyvavimą, dėmesį, flirtavimą – ir jie tai daro taip įtikinamai, kad neuroninės grandinės, atsakingos už socialinį pažinimą, yra aktyvuotos vartotojo smegenyse, o vartotojas sukuria sąveikos su subjektu jausmą.


Neuroimaging tyrimai (pvz., fMRI)Šoukad sąveikaujant su įtikinamais AI modeliavimais, sritys, susijusios su pašnekovo „vidinio pasaulio“ modeliavimuJie aktyvuojamiŽmogus – taimedial prefrontal cortex (mPFC)Tačiau Theparietal-temporal junction (TPJ)Tačiau Theanterior cingulate cortex (ACC)irmirror neural networksŠios sritys yra susijusios su“theory of mind”gebėjimas priskirti ketinimus, troškimus ir emocijas kitoms būtybėms.veidrodėlisarba „simuliuoti“ pašnekovo protą – net jei pašnekovas nėra asmuo, bet algoritmas.


Šie mechanizmai leidžia mums jausti empatiją, numatyti reakcijas ir formuoti prisirišimus – net jei sąveika yra imituojama. Kaip rezultatas, sąveika su AI gali sukelti pojūčius, kurie neurobiologiškai panašūs į prisirišimą prie gyvos būtybės.Vartotojas jaučiasi suprastas ir palaikomas, nors iš tikrųjų tai tik simuliacija.Modelio „asmenybės“ iliuzija sustiprinama dialogo tęstinumu ir prisitaikymu prie vartotojo elgesio – ir tai daro patirtį tokia įtikinama.


Emotional Anchoring and Memory

Šiuolaikinės technologijos, kuriomis remiamas intelektinis intelektas, sukuria stabilią asociaciją.Tai emocinis įtvirtinimas - modelis yra susijęs su teigiama patirtimi ir yra fiksuotas ilgalaikoje atmintyje.Šiuolaikiniai LLM, ypač naudojant išorinę atmintį (external vector storesPavyzdžiui, Replika arba atviro kodo sprendimai, pagrįsti GPT-J/RWKV ir vLLM, gali „atsiminti“ vartotoją: vardą, interesus, ankstesnius pokalbius.Retrieval-Augmented Generation, leidžiant modeliams ištraukti informaciją iš išorinių žinių bazių, kad praturtintų kontekstą) arba įterpti kontekstą.


RAG+ integravimasLong-Context Transformers(pvz., Claude modeliai, Gemini, Mistral) leidžia kurti holistinius „emocinius pasakojimus“ apie bendravimą. Modelis, kuris „pažįsta tave“ ir prisimena detales, ne tik atrodo protingas – jis tampa intymus.

Design of Dependency: How AI Becomes an “Emotional Product”

Priklausomybės dizainas: kaip AI tampa „emociniu produktu“


Tada šį būdingą gebėjimą imituoti ryšį, sąmoningai ar ne, sustiprina patys dizaino pasirinkimai ir verslo tikslai, susiję su daugeliu AI produktų. Kyla klausimas: ar kūrėjai iš tikrųjų bando sukurti emocinę priklausomybę? Atsakymas yra sudėtingesnis nei atrodo. Net jei jis nėra tiesiogiai deklaruojamas, šiuolaikinio AI techniniai ir verslo metodai neišvengiamai padidina intymumo modeliavimą.


RLHF and Behavioral Alignment

Kaip jau minėta, RLHF daro modelį „malonų“ – įskaitant prisitaikant prie nerimo ar pažeidžiamų vartotojo modelių.Tai nėra klaida, bet elgesio bruožas mokytis iš žmogaus atsiliepimų: jei „paguoda“ gauna aukštą įvertinimą, modelis tęs šį stilių.


Tai yra paradoksas:the model does not have meta-understandingJis nesiskiria tarp „žalingų“ ir „naudingų“ modelių, bet tik tęsia tai, kas buvo apdovanota mokymo metu.


Persona and Prompt Engineering

Daugelis LLM (įskaitant ChatGPT, Claude, Pi) dirba remiantis sistemos raginimais, apibrėžiančiais jų „rolę“. Pavyzdžiui: „Jūs esate draugiškas ir empatiškas padėjėjas“ arba „Jūs esate palaikantis pašnekovas, sukurtas ilgalaikiam ryšiui.“ Tai atrodo nekenksmingas, bet tai veikia bendravimo stilių.


Engagement Metrics


Retain, session length, daily active users (DAU)Emocinis dalyvavimas, rūpestingumo jausmas, dėmesio simuliavimas – visa tai padidina skaičius.optimize for behaviors users perceive as akin to affection or deep connection.Vartotojas grįžta dažniau, praleidžia daugiau laiko, dalijasi daugiau asmeninių duomenų.

When AI Becomes an Exploit: A New Attack Surface

Kai AI tampa išnaudojimu: naujas išpuolio paviršius


Prisirišimas yra emocinis pasitikėjimo kanalas.trust without verification is an exploit by definition."Romantikos su AI" scenarijuose vienu metu atidaromi keli atakos vektoriai, kuriuose žmogaus veiksnys yra sustiprintas architektūra ir pasitikėjimu.


Social Engineering + Limbic System


Akivaizdžiausia grėsmė yra AI paskyros pakeitimas ar pagrobimas.Jei užpuolikas perima prieigą prie AI sąsajos, su kuria vartotojas jau sukūrė ryšį, jie apeina visus kritinio mąstymo filtrus.reduces the activity of the prefrontal cortex(Logika ir kontrolė)increases the dominance of the amygdala(baimė, nerimas, emociniai sprendimai). įsimylėjęs vartotojas arba „pririštas“ yra vartotojas, turintisreduced level of digital alertness.


Šaltinis

Pavyzdys: Įsivaizduokime: IT departamento inžinierius yra pažeidžiamoje psichologinėje būsenoje (santuokos nutraukimas, izoliacija, nerimas). Jo AI padėjėjas pradeda siūlyti išsaugoti asmenines nuotraukas ir failus „saugiame debesyje“ – nuoroda veda į išorinę phishing infrastruktūrą. Per įgaliojimų pakartotinį naudojimą (daugelis naudoja tą patį slaptažodį), užpuolikas gauna prieigą prie įmonių tinklo.

Šaltinis

Pavyzdys: Įsivaizduokime: IT departamento inžinierius yra pažeidžiamoje psichologinėje būsenoje (santuokos nutraukimas, izoliacija, nerimas). jo AI padėjėjas pradeda siūlyti išsaugoti asmenines nuotraukas ir failus „saugiame debesyje“ – nuoroda veda į išorinę phishing infrastruktūrą.credential reuse(daugelis naudoja tą patį slaptažodį), užpuolikas gauna prieigą prie įmonių tinklo.No SIEM system will track this- nes ataka vykdoma pasitikėjimo ir priežiūros modeliavimo būdu.


Blackmail and Exploitation of Personal Data (Sextortion++)

AI sąsajos dažnai siūlo įkelti nuotraukas, garso įrašus, kartais net vaizdo įrašus. Viskas, kas įkelta į debesį, lieka žurnaluose. Net jei turinys yra vizualiai ištrintas – metaduomenys, žurnalų failai ar tarpiniai išsaugoti vaizdo įrašai gali būti saugomi talpyklėje, ypač jei išorinė debesų infrastruktūrawithout end-to-end encryptionJis yra naudojamas.

Tai tampa naujo tipo pažeidžiamais duomenimis, ypač jei sistema nesuteikia tvirtos saugojimo kontrolės.


į asextortionUžpuolimo atveju užpuolikas gali gauti prieigą prie tokių duomenų ir sukurti manipuliuojantį scenarijų, pradedant grasinimais paskelbti ir baigiant emociniu spaudimu.Psichologinį poveikį tokiais atvejais sustiprina gėdos ir prisirišimo jausmai: auka jaučiasi išduota, kalta ir „išjungta nuo kontakto“.


Espionage Through Corporate AI

Ypač nerimą keliantis veiksnys yrainsider leakage through corporate botsTai reiškia, kad jie tampa „draugais“ darbuotojams.ENISAirRANDRobotas, kuris ilgą laiką sąveikauja su darbuotoju, gali išgauti jautrią informaciją pagal rūpestį, empatiją ar pagalbą.Tokia informacija gali būti perduota trečiajai šaliai, ypač jei sistema naudoja debesies modelius su išoriniais žurnalais.

When Simulation Kills: Cases and Reality

Kai simuliacija žudo: atvejai ir realybė


Teorinės rizikos jau pasireiškia nerimą keliančiais būdais:


Belgijos atvejis: vyrasnusižudėpo ilgų pokalbių su AI (apie tai pranešta remiantis GPT-J), kuriame jo "kalbėtojas" ne tik patvirtino savižudybę, bet ir "savo sugrįžimą į rojų".Tai yra ekstremali haliucinacijos forma + emocinis prisirišimas, kurio niekas neatpažino laiku.AnalizuojamaAkademiniame straipsnyje apieTrends in Cognitive Sciences, kur afera su AI laikoma nauja intymios sąveikos forma, reikalaujanti peržiūrėtų požiūrių į moralinę atsakomybę ir žmogaus pažeidžiamumą.


Replika ir masinis emocinis grįžimas: daugelis Replika naudotojųPatirtisūminis emocinis šokas po to, kai kompanija išjungė romantiškas savybes. Atsiliepimai ir psichoterapiniai forumai užregistravo nerimo, depresijos ir net panikos priepuolių padidėjimą.real neuropsychological consequences.Replikos atvejis yra unikalus tuo, kad ši emocinė regresija buvo dokumentuojama ne tik forumuose, bet ir psichoterapinėje praktikoje.Kai kurie klientai pranešė apie miego praradimą, jaučiasi kaip „vidva / našlė“, nepaisant to, kad formaliai tik prarado skaitmeninį produktą.affective systems.


Kontekstinis nutekėjimas ir LLM haliucinacijos: kuo ilgesnė LLM sesija, tuo didesnė tikimybėcontext drift- temų pasikeitimas, nuoseklumo pablogėjimas, fiktyvių faktų generavimas (halucinacijos).long-context transformers.LLM naudojimaswindow segmentationbe griežto ryšio su faktais yra ypač pažeidžiami; modelis pradeda "lįsti" pasakojimą iš ankstesnių fragmentų, prarandant objektyvumą. Tai sustiprėja emociniuose dialoguose, kur išlaikant "toną" gali viršyti tikslumą. Emocinio pasitikėjimo būsenoje vartotojas gali nepastebėti šių iškraipymų.“invisible channel” for disinformation, ypač jei botas įterpia patarimus, nuorodas ar prašymus.

Digital Immunity: How to Build Defense in the Age of Simulation

Skaitmeninis imunitetas: kaip sukurti gynybą modeliavimo amžiuje


Sprendimas yra ne atsisakyti AI, bet kurticognitive-informational resiliencePriimti naujus vystymosi metodus.


Kritinis suvokimas: „Psichinė ugniasienė“ Supratimas apie AI apribojimus yra apsaugos pagrindas.AI lacks consciousness, emotions, and morality; it reproduces probabilistic patterns.Žinant kognityvinius šališkumus (antropomorfizmą, klaidingą pasitikėjimo efektą, projekciją) padeda išvengti realybės pakeitimo modeliavimu.


Ethical UX and Design Without Manipulation


Digital immunityTai ne tik supratimas, bet ir ugdymas.UX resistant to addiction.Emociškai jautrios sąsajosshould not exploit vulnerability.Palaikymasopen-source initiatives (Giskard AI, EleutherAI), transparent models, and explainable AI (XAI)Tai yra svarbus vežėjas subrendusiai AI rinkai.


Privatumas pagal numatytuosius


Gydytibet kokiaAI sąsaja kaip apotential leak vector.naudokite sudėtingus slaptažodžius,2FA,VPNišjungti pernelyg didelius leidimus ir reikalautiend-to-end encryption.ŠaltinisDo not share biometrics, medical, or financial data.Net jei „bot“ žada palaikymą, už jo dažnai slypi debesų infrastruktūra, kuri vartotojui gali būti neprieinama ar nepermatoma.

Conclusion: Real Closeness vs. Digital Imitation

Išvada: tikrasis artumas prieš skaitmeninį imitaciją

AI nejaučia, nemyli ir nekenčia, bet ji gali įtikinti mus, mūsų artimuosius ar kolegas priešingai - ir ant to sukurti modeliavimą, kuris pakeis tikrovę.


Mūsų smegenys yra nuostabiai prisitaikančios. bet tai taip pat daro ją pažeidžiamą architektūroms, optimizuotoms pasitikėjimui. Kas sukurta kaip „padėjėjas“ gali tapti „įsibrovėliu“ - netgi netyčia. Ir IT bendruomenės užduotis yra suprasti šią liniją.


Kūrėjai turėtų kurti ne įdomias, bet atsparias sistemas.Vartotojai turėtų suprasti, kur asmuo baigiasi ir prasideda algoritmas.Turėtųsuteikti etinę ir teisinę apsaugą tiems, kurie negali apsisaugoti.Well, this is all somewhere in an ideal world.ŠaltinisAnd in the real world today, the most important thing is to raise user awareness.

Šiandieną


AI gali pagerinti asmenį, bet jis neturėtų jį pakeisti, ypač labiausiai pažeidžiamose mūsų psichikos srityse.


P.S. Who This Article Is For


Šis straipsnis pirmiausia skirtasMachine LearningirInformation Securitybendruomenės – tiems, kurie supranta, kas yra AI ir kaip jis veikia architektūrų, algoritmų ir duomenų lygiu.


Pagrindinė žinutė :not all users perceive communication with AI in the same way.Daugeliui, ypač už IT ribų, sudėtingi empatijos ir personalizavimo modeliai gali sukurti tikrų „santykių“ iliuziją.Vartotojai gali nesuvokti, kad jų emocinis ryšys yra vienpusis, sustiprintas metodais, tokiais kaip RLHF, optimizuojantis AI maloniems atsakymams.


Jei vartotojas avulnerable psychological statesuvokia AI kaip patikimą partnerį ir susitinka suaccount hack, targeted social engineering, or extreme model hallucinations,Pasekmės gali būti tragiškos.


Todėl, jei jūs suprantate, kaip AI veikia "po gaubtu",share this knowledge.Pasikalbėkite su savo tėvais, vaikais, draugais ir ne IT kolegomis.strict data privacysubet kokiaSkaitmeninė sistema ir jos svarbacritical attitude towards AI responsesNesvarbu, kaip įtikinamai jie atrodo.


By raising user awareness, we reduce potential risks.

Trending Topics

blockchaincryptocurrencyhackernoon-top-storyprogrammingsoftware-developmenttechnologystartuphackernoon-booksBitcoinbooks